Model Selection

Vision Encoder-Decoder

# Vision Encoder-Decoder

Vit Base Patch16 224 Turkish Gpt2

This is a vision encoder-decoder model based on ViT and Turkish GPT2 for generating Turkish image descriptions.

Transformers Other

Trocr Small Korean

TrOCR is a Korean image-to-text model based on a vision encoder-decoder architecture, using DeiT as the image encoder and RoBERTa as the text decoder.

Image-to-Text Korean

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase